草庐IT

AI 中医

全部标签

当GPT-4V充当机器人大脑,可能你都没AI会规划

GPT-4V已经能帮我们设计网站代码,控制浏览器,这些应用集中在虚拟数字世界中。假如我们把GPT-4V带入现实世界,让它作为控制机器人的大脑,会有什么有趣的结果呢?最近,来自清华大学交叉信息研究院的研究者提出「ViLa」算法,实现了让GPT-4V走进物理世界中,为机器人操作日常生活物品提供任务规划。ViLa全称是RoboticVision-LanguagePlanning,它利用GPT-4V在视觉和语言两个模态上做联合推理的能力,把抽象的语言指令分解为一系列可执行的步骤。ViLa最让人惊喜的是它展现出对物理世界中常识的理解,而这是很多之前基于大语言模型(LLM)的机器人任务规划算法所欠缺的。比

用活人脑细胞造AI系统!语音识别已成功,可无监督学习

由真实人脑细胞构建的“迷你大脑”和微电极组成的AI系统,已经能够进行语音识别——从数百个声音片段中准确认出某个特定人的声音的那种。最近,一项颇为前沿的类脑研究登上了Nature子刊。这个特别的AI系统甚至可以进行无监督学习:研究人员只是一遍遍播放音频片段,不提供任何形式的反馈来告诉系统答对还是错。最终,该系统在两天的训练之后,准确率直接从最初的51%升到了78%。这,究竟是怎么实现的?类器官神经网络来了发明该系统的主要目的,是解决硅芯片的高能耗等问题。一般来说,这个问题的解题思路都是靠类脑计算。但这种思想下设计的“传统”类脑芯片大多数都是直接基于数字电子原理,完全模仿大脑功能的能力着实有限。在

Runway官宣下场通用世界模型!解决视频AI最大难题,竟靠AI模拟世界?

最近AI视频赛道的Pika1.0大火,两位华人创始人团队半年做出的产品几乎碾压了Runway接近两年的发展成果。面对Pika的步步紧逼,本以为Runway会发力,想办法至少在公关上扳回一城,结果Runway的应对策略是宣布:我不和你们卷,我的目标是星辰大海。Runway官方今天突然官宣,我们要做通用世界模型(GeneralWorldModel),用GenAI来模拟整个世界!通用世界模型(GWM)我们相信,人工智能的下一个重大进步将来自理解视觉世界及其动态的系统,这就是为什么我们要围绕通用世界模型开始一项新的长期研究工作。世界模型是一种对环境有着内部理解的AI系统。它可以利用自己对环境的理解来模

2024年AI云计算专题研究报告:智算带来的变化

今天分享的人工智能系列深度研究报告:《2024年AI云计算专题研究报告:智算带来的变化》。(报告出品方:华泰证券)报告共计:32页Al云计算2024:关注智算带来的新变化通过对海内外主要云厂商及其产业链上下游的跟踪,我们观察到云计算行业发生以下关键变化:1)智算需求或成驱动云计算行业未来增长新动能。海外市场中,3Q23北关三大云厂商(亚马逊、微软、谷歌)合计营收周比增长19.6%,增速与2Q23持平:国内市场中,3Q23国内厂商laaS板块总营收为1109亿元,同比增长28%,较2Q23基本持平。Al商业化的带动作用已逐步兑现,微软表示Al贡献Azure和其他云收入增长约3个百分点:百度表示传

为Gemini AI大模型找场景 谷歌Project Ellman项目曝光

谷歌团队提出一个设想,用AI技术处理用户照片及搜索引擎查询信息,全面分析出用户的生活是怎样的,这个项目名叫“ProjectEllmann”。按照最初的设想,ProjectEllmann会用LLM(比如Gemini)提取信息,从用户的照片中找到特定模式,然后制作一个聊天机器人,让它精准回答问题。谷歌宣称Ellmann将会成为“个人生活故事讲述者”。听起来很有趣,不过谷歌到底是想将Ellmann功能植入谷歌Photos,还是放进其它产品?目前还不得而知。谷歌Photos拥有10多亿用户,存储了4万亿张照片或者视频。目前谷歌正在利用AI技术优化产品线,Ellmann只是利用方式之一。几天前谷歌推出G

生成式 AI 与内容创作前瞻

过去一年,生成式AI迎来一波惊人的爆发式增长。随着ChatGPT的公开发布(没错,居然只是在短短一年之前),这项新技术如今已经无处不在。顺应这波潮流,从Office到eBay,几乎每一款应用程序都在引入生成功能,越来越多的用户也开始在日常工作和生活当中发现它的妙用。既然被冠以“生成”二字,内容创作者自然深刻体会到它作为工具集中强大补充性方案的威力。营销机构、广告创意、新闻机构乃至社交媒体上的大V们开始成为最热情的早期AI采用者。尽管生成式AI为提高效率、自动化创造性工作中的重复元素带来了巨大机遇,但同时也带来了严峻挑战。在将其纳入工作流程之前,专业人士还需要考虑版权、垃圾邮件、幻觉、算法设计公

CIO如何解决实施AI过程中面临的伦理问题

AI几乎满足了几乎每个行业组织的胃口。随着AI试点转向实际应用,关于道德AI必要性的讨论也在增加,同时也出现了“公平”、“隐私”、“透明”、“责任”和最大的术语——“偏见”。随着AI成为人们工作和开展业务的不可或缺的一部分,确保这些措施和其他措施得到考虑是CIO们将努力应对的一项艰巨任务。对于许多CIO来说,实施可能还处于萌芽阶段,但减轻AI模型中的偏见并平衡创新与伦理考虑已经是他们面临的最大挑战之一,他们发现,在技术进步和确保AI不会导致有害结果之间的界限很窄。全球咨询企业EgonZehnder服务和AI实践小组成员ChristophWollersheim指出了大多数企业在实施AI时需要关注

【腾讯云 HAI 域探秘】释放生产力:基于 HAI 打造团队专属的 AI 编程助手

文章目录前言一、HAI产品介绍二、HAI应用场景介绍三、HAI生产力场景探索:基于HAI打造团队专属的AI编程助手3.1申请HAI内测资格3.2购买HAI实例3.3下载CodeShell-7B-Chat模型3.4部署text-generation-inference(TGI)推理服务3.4.1下载text-generation-inference项目3.4.2安装Rust环境3.4.3安装Protoc3.4.4编译安装TGI3.4.5启动TGI服务3.5配置HAI安全组规则3.6配置IDE插件3.7效果展示四、HAI中TGI服务基准测试4.1安装text-generation-benchmar

AI,孕育新的阿里和腾讯

当互联网时代的红利渐行渐远,玩家们便开始了寻找下一个发展风口的探索和实践。无论是以阿里、腾讯、百度为代表的国内科技玩家,还是以Facebook、苹果、谷歌、微软为代表的国外科技巨头,无一不是如此。在这个过程当中,我们看到了数字货币的覆灭,我们经历了区块链的狂热,我们见证了元宇宙的火爆。然而,这些所谓的火爆和风口,终究没有跳脱出时间的磨砺,一点一点地沉寂下去了。从本质上来看,以数字货币、区块链、元宇宙为代表的所谓的新风口,之所以会难以延续,其中一个很重要的原因在于,它们并未找到与业已形成的互联网经济与传统经济之间找到正确的联通方式,而仅仅只是一个资本鼓吹下的概念游戏,最终,它们的颠覆和想象,变成

微软视频编辑工具 Clipchamp 迎来新功能,包含 AI 自动创作、AI 文本转语音

IT之家 12月12日消息,微软于2021年收购了Clipchamp,这是一款易于使用的基于Web的视频编辑工具。随后,Clipchamp被纳入Microsoft365个人版和家庭版订阅计划中。最近,微软将Clipchamp扩展到了Microsoft365商业版计划,并增加了导入Xbox主机视频片段的功能。在Microsoft365Insider博客的最新更新中,微软概述了最近添加或即将添加到Clipchamp的一些新功能。其中一个新功能是“自动创作”,Clipchamp网站上提供了更多关于这个AI功能的信息:只需上传您的照片和视频,选择一个视频风格,然后让我们的AI创建一个看起来专业的视频,